从50万份基因组数据中筛选出对重症早发型单病免疫的个体
基因慧
基因健康行业知识库
关键词:孟德尔遗传病 外显率 表现度
人类基因变异数据库 数据面板
数据收集和筛选
阅读时间:5min
点击文末“阅读原文”即可跳转至原文网站
人类的孟德尔遗传疾病指符合孟德尔遗传定律的人类单基因遗传疾病,这一类疾病的发病往往由单个基因的突变导致,但在人类的单基因遗传病中,还有一类复杂的现象,即某个个体携带致病基因,但却具有正常人的表型而没有发病,或者发病的严重程度在个体间具有较大差异,前者构成了孟德尔遗传疾病的外显率(penetrance)的差异,而后者对应某种疾病表现度(expressivity)的差异。造成这些差异的因素往往与基因间的相互作用有关,即某些基因的上位效应导致的在某些个体中致病基因的不外显或者表现度较低,因此这些基因对于孟德尔遗传疾病的发病具有一定的保护作用。
研究致病基因不外显的科学问题,首先需要在人群中找到符合这样的要求的个体,这在传统遗传学研究中是非常困难的事情,而近年来随着越来越多的个人基因组重测序数据的积累,为这一研究提供了机遇。在发表于“Nature Biotechnology”的一篇题为“Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases”的文章中,作者就利用现有数据资源,对这一问题进行的探讨。
首先,作者汇总了现有人类基因变异数据库中的注释信息,设计出用于筛选致病基因免疫个体的数据面板,其数据来源包含8个数据库,分别是:
(i) the Online Mendelian Inheritance in Man (OMIM) database (;
(ii) the Human Gene Mutation Database (HGMD; ;
(iii) GeneReviews (;
(iv) Genetics Home Reference (GHR; ;
(v) ClinVar (;
(vi) Orphanet (;
(vii) the Leiden Open Variation Database (LOVD;
(viii) Reference Variant Store (RVS)。
在此基础上,作者就其中的疾病注释信息对准入标准进行了设定,包括:只包含常染色体显性、隐性和伴X染色体遗传疾病,具有严重的疾病表现,早发(发病年龄<18岁),具有(几乎)完全的外显率。
根据这些标准,作者建立了两个检测方案:
核心检测面板(core allele panel,CAP),包含覆盖125种疾病的162个变异基因,共674种突变模式;
扩展检测面板(expanding allele panel,EAP),在CAP的基础上放宽准入条件,包括收入在HGND数据库中标注为“致病突变”,同时在1000人基因组计划和NHLBI GO数据库中显示等位基因频率<0.5%的变异位点,共包含24,186种变异模式(表1)。
(表1)
接着,作者收集了目前已发表的覆盖全世界范围的12个项目的589,306个个体基因组数据(数据来源见表2),应用上述建立的CAP和EAP检测模式进行数据筛选,最终在CAP中鉴定得到367个候选个体(包含44个突变),在EAP中鉴定得到15,230个候选个体(包含256个突变),合计15,597个候选个体。接着作者去除了6,667个由数据质量导致的低置信度候选个体,又去除了8,227个由于所覆盖的等位基因频率高于0.5%或者数据无法继续追踪的候选个体。
(表2)
对这此时所剩的303个初筛候选个体,作者进行了进一步的手动筛选,245个个体由于对应疾病的表现度不足够强而被去除,16个个体由于所携带变异缺乏足够的文献支持被去除,14个个体由于不足够“健康”被排除,15个个体在sanger测序验证后发现为杂合子,与最初测序数据显示为纯合子不一致被排除(表3),最终剩余13个满足条件的候选个体(表4),这13个个体携带理论上导致严重孟德尔疾病的基因突变,但表型健康。
(表3)
(表4)
在随后的工作中,作者试图对引起这一现象的保护性变异基因加以筛选,但由于样本数量过少而无法有效进行。但该工作首次在人群中找到了对传统认识上具有强致病性孟德尔遗传疾病免疫的个体的存在,提示在人类中存在更为复杂、更为普遍、效应也更强的基因上位效应,而发掘这些潜在基因,对于未来某些孟德尔遗传疾病的治疗,具有潜在的重要价值。
在精准医疗领域整合发展期,基因慧作为精准医疗行业互联网信息平台,结合近十年行业实践经验,互联网产品和大数据团队,连接专家、产业和资本,整合各方资源;运用Web 4.0搭建信息平台,为专家实现知识变现;搭建行业信息数据库,为企业决策提供市场数据支持。使连接产生价值,让知识获得尊重。
行研、咨询、会议、品宣等服务:
电话:010-56527551 / 400-088-7466地址:北京市海淀区中关村大街1号官网:www.geneclub.net.cn邮箱:info@genonet.cn基因慧
精准医疗
行业连接器
长按关注点击“阅读原文”,更多分享。